AI资讯新闻榜单内容搜索-DeepSeek V

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: DeepSeek V

一家营收千亿美元的公司，如何回应 AI 落地的策略问题

一家营收千亿美元的公司，如何回应 AI 落地的策略问题

一家营收千亿美元的公司，如何回应 AI 落地的策略问题

2025 年 9 月 19 日，亚马逊云科技官宣：Qwen3 和 DeepSeek v3.1，首次上线 Amazon Bedrock ，正式对外提供服务，再一次引起了全球生成式 AI 市场对 Amazon Bedrock 这一产品的关注。

来自主题: AI资讯

7827 点击 2025-09-23 15:07

刚刚，阿里首个超万亿参数新王登基！Qwen3-Max屠榜全SOTA，碾压DeepSeek V3.1

刚刚，阿里首个超万亿参数新王登基！Qwen3-Max屠榜全SOTA，碾压DeepSeek V3.1

刚刚，阿里首个超万亿参数新王登基！Qwen3-Max屠榜全SOTA，碾压DeepSeek V3.1

阿里迄今为止，参数最大的模型诞生了！昨夜，Qwen3-Max-Preview（Instruct）官宣上线，超1万亿参数性能爆表。在全球主流权威基准测试中，Qwen3-Max-Preview狂揽非推理模型「C」位，直接碾压Claude-Opus 4（Non-Thinking）、Kimi-K2、DeepSeek-V3.1。

来自主题: AI资讯

11030 点击 2025-09-06 10:16

第一性原理视角下的MoE推理的经济学分析

第一性原理视角下的MoE推理的经济学分析

第一性原理视角下的MoE推理的经济学分析

随着DeepSeek R1、Kimi K2和DeepSeek V3.1混合专家（MoE）模型的相继发布，它们已成为智能前沿领域大语言模型（LLM）的领先架构。由于其庞大的规模（1万亿参数及以上）和稀疏计算模式（每个token仅激活部分参数而非整个模型），MoE式LLM对推理工作负载提出了重大挑战，显著改变了底层的推理经济学。

来自主题: AI技术研报

7879 点击 2025-09-03 11:22

每月20元！智谱GLM-4.5杀入Claude Code，开启编程API“包月”时代

每月20元！智谱GLM-4.5杀入Claude Code，开启编程API“包月”时代

每月20元！智谱GLM-4.5杀入Claude Code，开启编程API“包月”时代

这段时间 AI 编程的热度完全没退，一个原因是国内接连推出开源了不少针对编程优化的大模型，主打长上下文、Agent 智能体、工具调用，几乎成了标配，成了 Claude Code 的国产替代，比如 GLM-4.5、DeepSeek V3.1、Kimi K2。

来自主题: AI资讯

12691 点击 2025-09-02 11:41

DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜

DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜

DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜

前些天，DeepSeek 在发布 DeepSeek V3.1 的文章评论区中，提及了 UE8M0 FP8 的量化设计，声称是针对即将发布的下一代国产芯片设计。

来自主题: AI资讯

8323 点击 2025-08-28 15:40

DeepSeek“极你太美”bug，官方回应了

DeepSeek“极你太美”bug，官方回应了

DeepSeek“极你太美”bug，官方回应了

DeepSeek V3.1上演的bug大秀“极你太美”，可谓是让全网热议了一波。简单来说呢，就是陆续有开发者们发现，当他们在调用API进行代码开发的过程中，输出结果里会时不时蹦出来“极”字。

来自主题: AI资讯

7508 点击 2025-08-27 17:09

热议！DeepSeek V3.1惊现神秘「极」字Bug，模型故障了？

热议！DeepSeek V3.1惊现神秘「极」字Bug，模型故障了？

热议！DeepSeek V3.1惊现神秘「极」字Bug，模型故障了？

上周三，DeepSeek 开源了新的基础模型，但不是万众期待的 V4，而是 V3.1-Base，而更早时候，DeepSeek-V3.1 就已经上线了其网页、App 端和小程序。

来自主题: AI资讯

8123 点击 2025-08-26 19:44

突发！Deepseek最新模型被外网爆出恶性Bug？？

突发！Deepseek最新模型被外网爆出恶性Bug？？

突发！Deepseek最新模型被外网爆出恶性Bug？？

一早起来，看到群里炸了锅！主角是我们备受期待的 DeepSeek V3.1 模型。有用户反馈，该模型在生成文本时，会毫无征兆地随机插入“极”这个汉字（繁体简体都会）

来自主题: AI资讯

9543 点击 2025-08-26 10:14

仅靠5000+样本，全新强化学习范式让30B轻松击败671B的DeepSeek V3

仅靠5000+样本，全新强化学习范式让30B轻松击败671B的DeepSeek V3

仅靠5000+样本，全新强化学习范式让30B轻松击败671B的DeepSeek V3

蚂蚁技术研究院联合浙江大学开源全新强化学习范式 Rubicon，通过构建业界最大规模的 10,000+ 条「评分标尺」，成功将强化学习的应用范围拓展至更广阔的主观任务领域。用 5000 样本即超越 671B 模型，让 AI 告别「机械味」。

来自主题: AI技术研报

6689 点击 2025-08-25 10:08

DeepSeek一句话让国产芯片集体暴涨！背后的UE8M0 FP8到底是个啥

DeepSeek一句话让国产芯片集体暴涨！背后的UE8M0 FP8到底是个啥

DeepSeek一句话让国产芯片集体暴涨！背后的UE8M0 FP8到底是个啥

DeepSeek V3.1发布后，一则官方留言让整个AI圈都轰动了，新的架构、下一代国产芯片，总共短短不到20个字，却蕴含了巨大信息量。

来自主题: AI资讯

7855 点击 2025-08-22 18:54

上一页当前第2页,共6页下一页